# 美味汤

[美味汤（Beautiful Soup）](https://www.crummy.com/software/BeautifulSoup/)是一个用于解析HTML和XML文档的Python软件包（包括处理格式不正确的标记，即未闭合标签，因此得名于标记汤）。它为解析页面创建了一个解析树，可用于从HTML中提取数据，这对于网络抓取很有用。[3]

## 安装和设置

```bash
pip install beautifulsoup4
```

## 文档转换器

查看[使用示例](/docs/integrations/document_transformers/beautiful_soup)。

```python
from langchain_community.document_loaders import BeautifulSoupTransformer
```